搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

基于 .NET 的 AI 流式输出实现AgentFramework+SignalR
基于.NET的AI流式输出实现技术栈选择AgentFramework:用于构建AI代理的框架，支持模块化设计和任务编排。 SignalR:实现实时双向通信，支持WebSocket等协议，适合流式数据传输。：前端技术：Vue3前端框架IDS4单点登录系统一库多租户解决方案多级缓存机制CAP事件集成SignalR实时通信领域驱动设计AI智能体框架RAGAI检索增强RabbitMQ消息队列项目地址：github 代理实现创建支持流式输出的AI代理：展开代码语言：C#AI代码解释publicclassStreamingAiAgent:IAiAgent{publicIAsyncEnumerable<string>GetStreamingResponse 处理能力和SignalR的实时通信特性，可以构建高效的流式AI响应系统。
18710编辑于 2026-01-21
来自专栏程序员分享
langgraph流式输出特性测试
langgraph在astream调用模式下, 当图中包含子图节点时, 输出捕获级别会因设置产生不一样的影响本次记录个人基于 langgraph v1.1.2 的测试结果准备工作导入包如下:python 节点内部调用 LLM Client 直接流式获取模型回答构建如下的图, node3 为使用 LLM client 而非CompiledGraph获取回答的节点python 体验AI代码助手代码解读复制代码 , 可以看到正常捕获到了单节点内部的流式输出有一个messages事件, 包含完整消息, 在节点return前后被捕获(似乎仅适用于LLM Client流式调用的情况, 使用CompiledGraph则不会包含 'ns': (), 'data': {'node4': {'log_info': {'node4': 'node4 执行日志'}}}}子图调用astream产生了四个"chunk", 但是它们并非模型流式输出的结果 , 'langgraph_checkpoint_ns': 'node2:f236c5a1-e972-bf00-0f4e-9300ead1eb69'})}可以观察到即使内部使用ainvoke, 父图期望流式获取大模型输出时
11510编辑于 2026-04-05
零基础学AI大模型之Stream流式输出实战
AI大模型之ChatModel聊天模型与ChatPromptTemplate实战 12、零基础学AI大模型之LangChain链零基础学AI大模型之Stream流式输出实战前情摘要在之前的LangChain 本文将聚焦LLM的Stream流式输出，从核心原理讲起，通过“故事小助手”“科普助手”两个实战案例，带你掌握从基础调用到LCEL表达式的流式落地，最后分析流式输出的优劣势与实战注意事项。 1. 为什么需要流式输出？先搞懂“一次性输出”的痛点在学习流式输出前，我们先明确：流式输出不是“让模型生成更快”，而是“让用户感知更快”。流式输出核心原理：什么是Stream？流式输出的优势与限制：实战前必看流式输出虽能提升体验，但并非适用于所有场景。我们需要客观看待其优劣势，避免盲目使用。
49010编辑于 2025-12-22
来自专栏码匠的流水账
langchain4j+springboot流式输出
序本文主要研究一下langchain4j+springboot如何实现流式输出步骤pom.xml <dependency> <groupId>dev.langchain4j }); }); }StreamingChatLanguageModel提供了StreamingChatResponseHandler用于处理片段结果，结合Flux可以实现流式输出源码
2.2K10编辑于 2025-02-24
来自专栏王磊的博客
聊聊SpringAI流式输出的底层实现？
在 Spring AI 中，流式输出（Streaming Output）是一种逐步返回 AI 模型生成结果的技术，允许服务器将响应内容分批次实时传输给客户端，而不是等待全部内容生成完毕后再一次性返回。技术实现在 Spring AI 中流式输出的实现有以下两种方式：通过 ChatModel 实现流式输出。通过 ChatClient 实现流式输出。 ChatModel 流式输出 Spring AI 中的流式输出实现非常简单，使用 ChatModel 中的 stream 即可实现： @RequestMapping(value = "/streamChat Spring AI 流式输出说完了前置知识，咱们回到主题：Spring AI 是如何实现流式输出的？生产级别使用的 Reactor 基本都是主从 Reactor 模型，它的执行流程如下：小结 Spring AI 中的流式输出有两种实现，而通过查看这两种流式输出的实现源码可知，Spring AI 中的流式输出是通过
1.2K10编辑于 2025-04-24
来自专栏鱼皮客栈
聊聊SpringAI流式输出的底层实现？
在 Spring AI 中，流式输出（Streaming Output）是一种逐步返回 AI 模型生成结果的技术，允许服务器将响应内容分批次实时传输给客户端，而不是等待全部内容生成完毕后再一次性返回。技术实现在 Spring AI 中流式输出的实现有以下两种方式：通过 ChatModel 实现流式输出。通过 ChatClient 实现流式输出。 ChatModel 流式输出 Spring AI 中的流式输出实现非常简单，使用 ChatModel 中的 stream 即可实现： @RequestMapping(value = "/streamChat Spring AI 流式输出说完了前置知识，咱们回到主题：Spring AI 是如何实现流式输出的？生产级别使用的 Reactor 基本都是主从 Reactor 模型，它的执行流程如下：小结 Spring AI 中的流式输出有两种实现，而通过查看这两种流式输出的实现源码可知，Spring AI 中的流式输出是通过
1.4K00编辑于 2025-04-29
来自专栏实用技术
使用 Python 的 requests 库实现流式输出
使用 Python 的 requests 库实现流式输出import requestsurl = 'https://api.example.com/stream' # 替换为实际的API URLwith
42810编辑于 2025-07-30
来自专栏每月技术成长
大模型流式输出渲染导致的性能问题
Deepseek R1 32b（可惜的是其只提供 3 小时的动态域名，过期后需要重新生成，而绑定自定义域名的方式免不了繁琐的备案机制）发现问题在使用模板生成的网站中进行对话时，熟悉的风扇声又响起了……察觉到只有当流式生成 token 时，浏览器的 cpu 占用才会明显上升，也可以明显发现启用流式传输时，网络流量大大增加了，因此直接查看调用 API 以及负责渲染输出的模块。其具体代码平平无奇，看不出什么问题，但联想到流式传输时，有大量的 token 陆续到达，而代码里是收到一个 token 就直接进行渲染，这种简单的文字渲染并不会使用到 GPU，短时间多次渲染可能对于 cpu 来说也相当于较大的负载了，毕竟此时渲染大概率是没用上缓存的……总结未经优化直接在每次收到 token 后直接渲染，导致了 cpu 计算负担的增加，因而出现了一进行流式输出，笔者的老旧笔电直接风扇起飞的现象
57600编辑于 2025-04-14
来自专栏软件测试学习
AI用例生成增加流式输出、Markdown文档上传、模型配置检测、AI评审开关...
Release清单大家好，TestHub这次带来了重磅更新-AI 用例生成模块增加流式输出！下面是这次具体更新明细： 1.AI 用例生成配置优化：用例生成模块增加模型配置和提示词检测机制&引导提示提示词配置改到配置中心-AI 用例生成配置下增加生成行为配置，控制流式输出和 AI 评审开关 2、AI用例生成模块深度优化：用例生成增加Markdown格式需求文档上传前台生成用例页面，支持用户自由选择“流式模式”和“完整模式” 深度优化生成逻辑，增加流式输出优化默认编写提示词、评审提示词 3.增加生成行为配置，控制流式输出和 AI 评审开关默认输出模式 Ai用例生成配置下，这次增加了一个生成行为配置。主要用于配置默认输出模式：实时流式输出和完整输出。完整输出是我们上一版本的模式，很多小伙伴反馈在这个模式下，等待的时间比较长，体验不友好，所以这次特地加了流式输出。关于流式输出的功能，下面会做重点介绍。
19110编辑于 2026-03-22
来自专栏h5
Electron41 + Vite8打造流式输出客户端AI助手
从零开始:用electron41+vite8.0+Vue 3 + DeepSeek搭建一个支持流式输出的 AI 对话界面系统。功能支持性Electron41+Vite8接入DeepSeek流式打字输出，丝滑流畅内置light+dark主题支持深度思考R1模式支持Latex数学公式支持Mermaid图表渲染（拖拽、缩放、下载）支持代码块

</template>Vite8.0+Vue3.5+Arco深度对接DeepSeek网页版AI 智能助手2026版開工新作uni-app+mphtml结合deepseek跨端ai应用vite7.2-deepseek流式ai对话|vue3.5+vant4+katex+mermaid智能ai打字会话最新实战 Vite7.3+Tauri2.10深度集成DeepSeek桌面端AI智能助手Electron-DeepSeek-Chat流式AI系统|electron39+vue3+deepseek手搓aielectron38

23710编辑于 2026-03-27

来自专栏陶士涵的菜地

HTTP方式请求并处理GPT聊天补全接口的流式响应输出

python使用HTTP方式，调用OpenAI的聊天补全的流式响应接口，并处理数据目的是，如果需要对接fastGPT等其他第三方，需要额外增加参数，或者其他开发语言调用时，不能使用官方的类库。

2K10编辑于 2024-01-03

来自专栏灵墨AI探索室

深入探索Spring AI：源码分析流式回答

在上一章节中，我们深入分析了Spring AI的阻塞式请求与响应机制，并探讨了如何增强其记忆能力。今天，我们将重点讲解流式响应的概念与实现。毕竟，AI的流式回答功能与其交互体验密切相关，是提升用户满意度的重要组成部分。基本用法基本用法非常简单，只需增加一个 stream 方法即可实现所需功能。总结在当今的数字时代，流式响应机制不仅提升了系统的性能，还在用户体验上扮演了关键角色。我们终于全面讲解了Spring AI的基本操作，包括阻塞式回答、流式回答以及记忆增强功能。这些内容为我们深入理解其工作机制奠定了基础。这将帮助我们更好地理解Spring AI的内部运作原理，并为进一步的优化和定制化提供指导。我是努力的小雨，一名 Java 服务端码农，潜心研究着 AI 技术的奥秘。

1.3K40编辑于 2024-09-30

来自专栏小孟开发笔记

Uniapp仿ChatGPT Stream流式输出（非Websocket）-uniapp+see接收推送示例

前言# 最近写一个chagpt小程序，流式输出可以使用websocket也可以使用stream来实现，这里就不折腾websocket的了，我发现uniapp实现流式输出的方式挺多的，主要是有些小程序还不兼容一个EventSource会对http服务开启一个持久化链接，它发送的事件格式是‘text/stream’，开启EventSource事件后，它会一直保持开启状态，直到被要求关闭后端php，原生实现个流式输出即可代表本次循环不进行输出 * @param $millisecond int 数据分发间隔，单位：毫秒 * @return string * @other void */ console.log(xhr.responseText) } } xhr.send() } EventSource方式# uniapp中也可以直接使用EventSource来实现流式输出 text); }) 这样就可以在小程序中把Arraybuffer转换为字符串了还有许多方式，比如调用第三方库来代替TextDecoder，我就不去尝试了注意： 1.enableChunked: true流式响应开关

6.2K21编辑于 2024-03-26

来自专栏Spring AI 进阶之路

Spring AI 进阶之路02：集成SSE实现AI对话的流式响应

这种实时反馈的交互体验，正是流式响应的独特魅力，也已成为AI应用的标配。在本篇文章中，我们将对项目进行升级改造，通过使用SpringAI的流式API与SSE（Server-SentEvents）技术，让AI响应如“打字机”般自然呈现。我们要将原来的同步聊天方法改造成流式处理，让AI的回复能够实时推送给用户。的实时响应，监听finish事件知道响应结束发送聊天请求：通过普通的HTTPPOST请求触发后端的AI聊天实时渲染响应：收到数据块时立即追加到页面上，实现"打字机"效果效果测试现在，让我们启动项目来体验流式响应的魅力试着问一些问题，你会发现AI的回复不再是漫长等待后的一次性呈现，而是像真人打字一样，一个字一个字地流畅展现。小结通过本文的学习，我们成功地将一个普通的AI聊天应用升级为支持流式响应的版本。

94000编辑于 2025-11-25

来自专栏CSDN博客

PPASR流式与非流式语音识别

/dataset/test.wav 输出结果： ----------- Configuration Arguments ----------- alpha: 1.2 beam_size: 10 beta # 单卡训练 python3 train.py # 多卡训练 python -m paddle.distributed.launch --gpus '0,1' train.py 训练输出结果如下： -- python eval.py --resume_model=models/deepspeech2/best_model 输出结果： ----------- Configuration Arguments /dataset/test.wav 输出结果： ----------- Configuration Arguments ----------- alpha: 2.2 beam_size: 300 beta /dataset/test_vad.wav --is_long_audio=True 输出结果： ----------- Configuration Arguments ----------- alpha

1.6K10编辑于 2021-12-07

来自专栏一英里广度一英寸深度的学习

流式计算

从spark 说起，谈谈“流式”计算的理解 spark是一个大数据分布式的计算框架，有一些并行计算的基础会更容易理解分布式计算框架的概念。 Spark streaming 解决秒级响应，即流式计算 spark streaming 将spark 批处理应用，缩小为一个微批micro batch，把microbatch作为一个计算单元。 ? 总结本文是关于spark streaming流式计算理解的介绍文章。希望读者能通过10分钟的阅读，理解spark streaming 及流式计算的原理。

4K20发布于 2018-09-12

Vue3 封装 AI 问答组件实现 AI 流式回答问题

代码教程 Vue3实现AI流式回答问题：组件封装与应用实例一、AI流式回答技术原理（一）传统请求与流式响应对比传统请求：客户端发送请求 → 服务器处理 → 一次性返回完整响应流式响应：客户端发送请求：支持流式输出的AI模型（如OpenAI GPT系列）通信协议：使用SSE(Server-Sent Events)或WebSocket 前端处理：实时解析和渲染流式数据二、Vue3组件封装基础（一）组件设计思路独立封装AI对话功能支持流式接收和渲染内容提供自定义样式和交互接口处理错误和加载状态（二）核心技术点使用Vue3的Composition API 处理异步数据流实现文本逐字渲染动画使用fetch API发起请求通过ReadableStream读取流式数据解析SSE格式数据（data: {...}）流式问答组件。

1.3K10编辑于 2025-09-03

来自专栏全栈程序员必看

流式布局简单_CSS3流式布局

81720编辑于 2022-11-17

来自专栏小孟开发笔记

使用SSE技术调用OPENAI接口并实现流式输出，用PHP语言实现

作为AI语言模型服务提供商，OpenAI 提供了一系列的 API 接口，其中大部分需要通过 HTTP 请求访问。对于大量数据的请求，传统的同步请求会导致网络响应变慢，无法满足实时数据处理和分析的需求。因此，为了优化这些接口的调用效率，我们可以利用 SSE(Server Sent Events) 技术来实现流式输出，保证数据能够实时到达客户端，提高数据处理效率。在 PHP 语言中，我们可以借助 GuzzleHttp Library 以及 ReactPHP Library 等工具库，通过 SSE 技术来实现 OpenAI 的 API 接口的调用和流式输出。注意到在这里我们设置了对响应流的事件监听，以便解析响应结果并实现流式输出。最后，我们输出了当前这个响应数据结果。通过上述的代码实现，我们就可以轻松地将 OpenAI 的 API 接口进行 SSE 调用，实现流式输出，并有效提高数据处理效率。

3.5K10编辑于 2024-03-26

AI 流式响应实战：从同步等待到实时推送

AI流式响应实战：从同步等待到实时推送在IM系统中集成AI时，流式响应能显著提升性能。本文介绍AQChat如何实现AI流式响应，从同步等待到实时推送。一、为什么需要流式响应？ 1-2秒10秒好回调函数模式的设计统一接口设计定义统一的AI服务接口：展开代码语言：JavaAI代码解释publicinterfaceIAiService{/***流式调用AI服务*@paramuserMsg 代码解释//流式消息通知messageStreamMsgNotify{stringroomId=1;//房间IDstringmsgId=2;//消息IDUseruser=3;//AI助手信息int32streamType 平台集成的统一接口设计问题：不同AI平台的API不同阿里百炼：使用Flowable<GenerationResult>GiteeAI：使用MessageHandler<String>其他平台：可能有不同的流式接口解决方案 WebSocket实时推送提升响应速度七、总结关键点流式响应：使用回调函数模式，实时推送每个数据块统一接口：IAiservice统一不同AI平台的接口WebSocket推送：通过STREAM_MSG_NOTIFY

23610编辑于 2026-01-11

基于 .NET 的 AI 流式输出实现AgentFramework+SignalR

langgraph流式输出特性测试

零基础学AI大模型之Stream流式输出实战

langchain4j+springboot流式输出

聊聊SpringAI流式输出的底层实现？

聊聊SpringAI流式输出的底层实现？

使用 Python 的 requests 库实现流式输出

大模型流式输出渲染导致的性能问题

AI用例生成增加流式输出、Markdown文档上传、模型配置检测、AI评审开关...

Electron41 + Vite8打造流式输出客户端AI助手

HTTP方式请求并处理GPT聊天补全接口的流式响应输出

深入探索Spring AI：源码分析流式回答

Uniapp仿ChatGPT Stream流式输出（非Websocket）-uniapp+see接收推送示例

Spring AI 进阶之路02：集成SSE实现AI对话的流式响应

PPASR流式与非流式语音识别

流式计算

Vue3 封装 AI 问答组件实现 AI 流式回答问题

流式布局简单_CSS3流式布局

使用SSE技术调用OPENAI接口并实现流式输出，用PHP语言实现

AI 流式响应实战：从同步等待到实时推送

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

基于 .NET 的 AI 流式输出实现AgentFramework+SignalR

langgraph流式输出特性测试

零基础学AI大模型之Stream流式输出实战

langchain4j+springboot流式输出

聊聊SpringAI流式输出的底层实现？

聊聊SpringAI流式输出的底层实现？

使用 Python 的 requests 库实现流式输出

大模型流式输出渲染导致的性能问题

AI用例生成增加流式输出、Markdown文档上传、模型配置检测、AI评审开关...

Electron41 + Vite8打造流式输出客户端AI助手

HTTP方式请求并处理GPT聊天补全接口的流式响应输出

深入探索Spring AI：源码分析流式回答

Uniapp仿ChatGPT Stream流式输出（非Websocket）-uniapp+see接收推送示例

Spring AI 进阶之路02：集成SSE实现AI对话的流式响应

PPASR流式与非流式语音识别

流式计算

Vue3 封装 AI 问答组件实现 AI 流式回答问题

流式布局 简单_CSS3流式布局

使用SSE技术调用OPENAI接口并实现流式输出，用PHP语言实现

AI 流式响应实战：从同步等待到实时推送

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

流式布局简单_CSS3流式布局